DATASETS

1 Importation des librairies

2. Chargement des datasets

3 Profiling des données et Analyse¶

Fusion des 2 dataframes Merged_WID et df_GII¶

Classer les informations en fonction de leur valeur GINI (GII)¶

Après un tri asc sur le Gii, nous créons 3 catégories TOP15 = 15 pays les mieux notés MEDIUM = le reste de pays FLOP15 = 15 pays les moins bien notés

conditionlist = [(merged['top_1_percent'] <=) , (merged['Gender Inequality Index'] >= 0.070) & (merged['Gender Inequality Index'] <0.440), (merged['Gender Inequality Index'] >= 0.440)] choicelist = ['TOP15', 'MID', 'FLOP15'] merged[INEQUALITY_Ranking'] = np.select(conditionlist, choicelist, default='Not Specified') merged.head(16)

Conclusion : Les graphiques ci-dessous présentent en couleur (TOP 15, MID et FLOP 15), les pays dont où l'égalité entre homme et femme à l'ascension au travail est respecté. Et la taille des 'ronds' présente l'inégalité des revenus dans le monde (119 pays) pour l'année 2019. Plus le rond est gros, plus l'inégalité des revenus est importante. i-e, que les 1% ou les 10% de la population gagnent beaucoup trop par rapport au revenu total de la population. Exemple du Luxembourg qui figure dans le TOP 15 i-e que l'égalité entre hommes et femmes est respectée. Cependant la répartition des revenus est inégale car on observe que 10% de la population gagne presque 2/3 des revenus de la population du pays. 'Good Country' : Le pays bas et la Belgique sont les bons élèves de cette enquête. Egalité entre hommes et femmes respecté. De plus la répartition des richesses est mieux ventilée. Les mauvais 'élèves' sont l'Inde, le Gabon, la Guyane, le Maroc dans le flop 15 et répartition des richesse inégale. Les 1 ou 10% de la population possèdent toute la richesse du pays.

Distribution du nombre du bottom_50_percent

On peut en déduire que les variables de répartition de la richesse et l'égalité des sexes (VIa GII° ne sont pas corellées)

Récupération et enrichissement des datasets pour une représentation cartographique.

# Exportation du dataframe df2 dans un fichier csv que l'on nommera countryLocalisation #dfs.to_csv('countryLocalisation.csv')
# Faire une jointure entre le dataframe countryLocalisation2 et le dataframe continent pour avoir le pays, continent, longitude et latitude sur le même dataframe. La clé commune est le 'code_2 du dataframe continent' et le 'country du dataframe countryLocalisation2'

Preparation étape de visualisation

L'europe est le continent qui contient le plus de pays égalitaires. Soulignons qu'aucune nations des USA se trouve dans le top 15

Rappel : Le dataset wid contenait les informations concernant l'inégalité des revenus dans le monde (119 pays) pour l'année 2019, Contenait des informations concernant la part que les 1%, 10% et 50% de la population gagnent par rapport au revenu total de la population. Le dataset GII : estimé selon trois dimensions : la santé reproductive des femmes, leur autonomisation et le marché du travail Compris entre 0 et 1, plus sa valeur est élevée, plus le pays est inégalitaire entre hommes et femmes.

Nous avons ajouté une mesure contenant : TOP15 = 15 pays les mieux notés MEDIUM = le reste de pays FLOP15 = 15 pays les moins bien notés